Reinforcement Learning from Human Feedback (RLHF)
Journaux liées à cette note :
Journal du lundi 01 décembre 2025 à 08:02
Dans le livre "La parole aux machines", j'ai appris beaucoup de choses au sujet de la technique Reinforcement Learning from Human Feedback (RLHF).